▶ 아파치 하둡(Hadoop, High-Availability Distributed Object-Oriented Platform)
아파치 하둡은 대량의 자료를 처리할 수 있는 큰 컴퓨터 클러스터에서 동작하는 분산 응용 프로그램을 지원하는 프리웨어 자바 소프트웨어 프레임워크이다. 하둡은 하둡 공통 패키지로 구성되어 있다. 이 패키지에는 하둡 파일 시스템(HD
데이터마이닝을 간단하게 말하다면 데이터 분석이라고 할 수 있을 것이다. 굳이 데이터마이닝이라는 개념이 알려지기 전의 데이터 분석과는 구분을 하고 의미를 찾고자 한다면, “복잡성이 높은 데이터 분석에 인공지능(artificial intelligence)이나 패턴인식(pattern recognition) 등에서 연구되어 오고 있는 기
- AGILE -
‘애자일(Agile)’이란 용어는 소프트웨어 개발 방식의 하나로 많이 쓰이는 말이다. 개발 및 작업 계획을 짧은 단위로 세우고 시제품을 만들어 나가는 사이클을 반복함으로써 고객의 요구 변화에 유연하고도 신속하게 대응하는 개발 방법론이다. 이와 반대되는 개념이 전통적 개발 방법론이라
사용하는 기술이다.
빅데이터의 분석 인프라
분석 인프라 - 하둡
하둡(Hadoop)은 오픈소스 분산 처리 기술 프로젝트로 HDFS, Hbase, MapReduce로 구성되어 있다.
대형 스토리지 (HDFS) 를 구성하고, HDFS에 저장된 거대한 데이터셋을 간편하게 처리 할 수 있는 Java 기반의 MapReduce 프레임워크를 제공한다.
서론:
빅데이터는 현대 사회에서 빠르게 중요성을 갖추고 있는 주제 중 하나로, 정보의 수집과 분석을 통해 가치를 창출하는 데 핵심 역할을 합니다. 이 레포트에서는 빅데이터의 3V 개념을 자세하게 이해하고, 빅데이터가 주목받기 시작한 결정적인 계기를 깊이 파헤치며, 빅데이터와 미래에 대한 전
- 2020년 정보처리기사 NCS기반 전면 개편!
- 정보처리기사 시험은 NCS 학습 모듈 중 정보통신 분야의 ‘정보기술’ 분류에 포함된 ‘정보기술개발’과 ‘정보기술운영’에 속한 125개의 학습 모듈을 기반으로 하고 있다.
- 1과목 소프트웨어 설계, 2과목 소프트웨어 개발, 3과목 데이터베이스 구축, 4과목
1. 빅데이터의 특징을 기존 데이터와 비교하여 설명하시오. (10점)
빅데이터의 공통적 특징은 3V로 설명할 수 있다. 속도는 대용량의 데이터를 빠르게 처리하고 분석할 수 있는 속성이다. 융복합 환경에서 디지털 데이터는 매우 빠른 속도로 생산되므로 이를 실시간으로 저장, 유통, 수집, 분석처리가
IT 기술의 발전으로 인해 사용자간 실시간 연결과 소통의 스마트폰 혁명은 데이터 폭증을 발생시켰고, 기존의 데이터 자장,관리,분석기법은 한계에 도달하였으며, 지능화, 개인화 등 스마트시대 주요 패러다임 선도를 위해서는 빅데이터를 활용하는 것이 핵심이 되었다.
Cisco(2012)의 보고서에 의하면 201
빅데이터 및 R에서의 빅데이터 활용
1. 개요
현대 사회는 어마어마한 양의 데이터를 만들어내고 있으며 정부 업무도 예외가 아니다. 복지수당 및 국민건강보험(National Health Service)의 관리에서부터 여권 및 운전면허 발급에 이르기까지 공공부문 전반에서 방대한 양의 데이터가 공공 서비스 운영 중에 쌓
Ⅳ. 빅데이터산업 발전방안
빅데이터 기술은 기업에는 새로운 비즈니스 모델 창출, 공공기관에는 비용절감, 개인 소비자에게는 맞춤식 정보서비스의 이용이라는 새로운 기회를 제공할 수 있다. 세계 각국의 기업과 정부는 빅데이터 기술이 단지 새로운 기술의 등장이 아닌 기업과 국가의 경쟁력을